回顧一 下,Learned Index建置Model,學習資料的CDF分布,預測出位置。
但是,有一個問題是對於Model來說,預測出的位置可能會有錯誤,也就是所謂的預測誤差,那怎麼辦呢? 這樣不就找不到資料ㄇ....
Kraska et al. 對於不精準的問題,提出一個方法,每當Model訓練完後,
針對Model預測出來的位置與真實的位置進行誤差的計算,計算Model預測位置 大於真實位置 與 小於真實位置 的最大誤差。
使得Model查詢可以在 pos - min_err 與 pos + max_err 進行 binary search。
換句話說,即便Model預測不準,一樣能在一定的範圍內查找到資料 ~